نویسنده : سهراب جلوه گر جلوهگر
تاریخ : سه شنبه 19 شهريور 1394
|
██ متن فصل شانزدهم نسخهی رایگان ایبوک هوش مصنوعی ██
مترجم: سهراب جلوه گر جلوهگر
فصل شناخت سُخَن یا سخنشناسی
فهرست برخی از عنوانهای نوشتهها
سخنشناسی
سخن به صورت استدلال احتمالی
مدلهای پنهان مارکوف
سخنشناسی
تعریف نخست: عملیّات لازم برای توانمندسازی یک کامپیوتر برای شناسایی و واکنش دادن به صداهای به وجود آمده در سخن انسان میباشد .
تعریف دوّم: سخنشناسی یا تشخیص صدا ، توانایی سیستمهای کامپیوتری برای دریافت سخن به صورت ورودی و پردازش بر روی آن یا بیان آن به صورت نوشته میباشد.
کاربردهای عملی سخنشناسی شامل سیستمهای پرسوجوکننده از پایگاه داده و سیستمهای بازیابی اطّلاعات میباشد. سخنشناسی دارای کاربرد در روبوتیک و مخصوصاً توسعهی روبوتهایی که میتوانند «بشنوند»، میباشد.
سخن به صورت استدلال احتمالی
سیگنالهای سخن، پارازیتدار(اغتشاشدار) ، متغیّر و مبهم میباشند؛ [در این صورت] شبیهترین ترتیب کلمات و سیگنال سخن ارائه شده چیست؟، برای این کار از قانون بیز استفاده نمایید:
P(Words|signal) = αP(signal|Words)P(Words)
تمام سخنان انسان ترکیبی از 40 تا 50 صُوْتْ میباشد. آرْپابِتْ ، الفبایی برای بیان صداهای موجود در انگلیسی آمریکایی میباشد و به صورت زیر است:
[iy] beat [b] bet [p] pet
[ih] bit [ch] Chet [r] rat
[ey] bet [d] debt [s] set
[ao] bought [hh] hat [th] thick
[ow] boat [hv] high [dh] that
[er] Bert [l] let [w] wet
[ix] roses[ng] sing [en] button
برای مثال، برای کلمهی «ceiling« داریم: [s iy l ih ng] / [s iy l ix ng] / [s iy l en]
صداهای سخن - سیگنال خام میکروفون به صورت تابعی از زمان میباشد؛ سیگنالهای صوتی که در ابتدا به صورت آنالوگ هستند، به صورت سیگنال دیجیتالی نمونهبرداری شدهی پلّهای در میآیند، در پردازش، قابها روی هم میافتند و همگی به وسیلهی پستی و بلندیاشان تشخیص داده میشوند.
صوتهای سه بخشی : هر صوت دارای سه بخش میباشد(آغاز ، وسط و پایان )، به عنوان مثال، حرف [t]، دارای ابتدای آرام ، وسط قوی و انتهای خَشِنْ میباشد.
مدلهای پنهان مارکوف
به طور گستردهای در تعداد زیادی از سیستمها مورد استفاده قرار میگیرند. سیستمهای سخنشناسی پیشرفته براساس مدلهای پنهان مارکوف میباشند؛ مدلهای پنهان مارکوف مدلهایی آماری هستند که رشتهای از سمبلها را به وجود میآورند. از مدلهای پنهان مارکوف به این دلیل در سخنشناسی استفاده میشود که، سیگنال سخن میتواند به صورت تکّه سیگنالی ثابت یا سیگنالی ثابت کوتاه مدّت دیده شود؛ در زمانی کوتاه، مثلاً ده میلی ثانیه، سخن میتواند به صورت یک پردازش ثابت تخمین زده شود. دلیل دیگری که از این مدلها استفاده میکنیم، این است که، از نظر محاسباتی امکانپذیر هستند.
چکیدهی مطلبهای فصل شانزدهم
سخنشناسی، توانایی سیستمهای کامپیوتری برای دریافت سخن به صورت ورودی و پردازش بر روی آن یا بیان آن به صورت نوشته میباشد.
سیستمهای سخنشناسی پیشرفته براساس مدلهای پنهان مارکوف میباشند؛ مدلهای پنهان مارکوف، مدلهایی آماری هستند که رشتهای از سمبلها را به وجود میآورند.
نظرات شما عزیزان:
:: برچسبها: ██ متن فصل شانزدهم نسخهی رایگان ایبوک هوش مصنوعی ██ , مترجم: سهراب جلوه گر جلوهگر , فصل شناخت سُخَن یا سخنشناسی , آموزش هوش مصنوعی,